1
Tiga Pilar AI Generatif
AI030Lesson 2
00:00

Bayangkan dunia di mana kecerdasan buatan tidak hanya mengenali matahari terbenam, tetapi juga melukisnya dari kehampaan. Ini adalah pergeseran paradigma dari model diskriminatifβ€”yang fokus pada perhitungan probabilitas $p(output|input)$ untuk menandai data yang sudah adaβ€”menuju ranah luas AI Generatif. Kita sedang bergerak melampaui batasan masa lalu menuju pemodelan dari distribusi data dasar.

Tiga Pilar Sintesis Dasar Tradisional: p(output | input)βš”οΈGANsAdversarial🌫️DiffusionPenghilangan NoiseπŸ”—TransformersUrutan

Mendefinisikan Lanskap Arsitektur

Klasifikasi kita didominasi oleh tiga strategi matematis yang berbeda, masing-masing menawarkan keunggulan unik untuk sintesis multimodal dan sintesis gambar:

  • Jaringan Generatif Adversarial (GANs): Duel berisiko tinggi antara dua jaringan sarafβ€” generator (si pembuat palsu) dan diskriminator (detektif). Ini interaksi adversarial mendorong generator untuk menciptakan konten yang semakin sulit dibedakan.
  • Model Diffusion: Proses mencari ketertiban dalam kekacauan. Model-model ini belajar dengan menambahkan dan menghapus noise secara iteratif dari data, akhirnya menguasai kemampuan membentuk representasi kuat dari statis murni.
  • Transformers Autoregresif: Para arsitek urutan. Model seperti Transformers Pratrain Generatif (GPT) beroperasi dengan memprediksi token berikutnya berdasarkan konteks semua hal yang telah datang sebelumnya, menciptakan narasi dan struktur koheren jangka panjang.
Sinkronisasi Arsitektur
Terobosan modern jarang menggunakan satu pilar secara terpisah. Sistem seperti Stable Diffusion menggunakan Transformer untuk memahami petunjuk teks Anda dan Diffusion proses untuk menghadirkan piksel visual, sering kali memanfaatkan efisiensi ruang laten yang ditemukan dalam Autoencoder Variational (VAEs).